iT邦幫忙

2025 iThome 鐵人賽

DAY 6
0
AI & Data

AI初學者入門系列 第 6

Day6 使用 OpenAI Embedding API

  • 分享至 

  • xImage
  •  

昨天大致了解了embedding,我今天要補充一些並做簡單的實作。

在 AI 的自然語言處理(NLP)應用中,「文字相似度比對」 是非常常見的需求。除了問答系統,還有其他不同的應用,例如:

  1. 新聞檢索與推薦: 找出跟某篇新聞標題或內文相似的其他文章
  2. 抄襲檢測: 比對兩篇文章是否高度相似
  3. 情感與意圖判斷: 分析不同句子是否表達相似
  4. 內容分類:比對文字內容並分類

目標是: 比對新聞標題與內文相似度(以用OpenAi API為例)

  1. 先去官網取得api(可以參考本系列Day4)

  2. pip install openai numpy

  3. 引入openai和numpy(算數學用)
    https://ithelp.ithome.com.tw/upload/images/20250808/20177905CMuhThcx3n.png

  4. 填入api、舉例標題和內容
    https://ithelp.ithome.com.tw/upload/images/20250808/20177905QNqDe0H0Ti.png

  5. 轉換成向量
    https://ithelp.ithome.com.tw/upload/images/20250808/201779054YKaLeBZAD.png

  6. 計算相似度的公式很簡單,就是高中學過的公式: cos夾角=(A⋅B)/(A×B),大家可以趁這機會複習
    https://ithelp.ithome.com.tw/upload/images/20250808/20177905ZYByoqPTKx.png

找出兩向量的角度

  • cos90度=0: 沒有關聯(方向垂直)
  • cos0度=1: 完全相似(方向一樣)

最後我測出來是
https://ithelp.ithome.com.tw/upload/images/20250808/20177905MBm1uMv5eI.png


上一篇
Day5 Embedding 與向量概念
下一篇
Day7 介紹FAISS 並儲存查詢
系列文
AI初學者入門30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言